فیلترها/جستجو در نتایج    

فیلترها

سال

بانک‌ها



گروه تخصصی











متن کامل


نویسندگان: 

AZIMI RASOOL | SAJEDI HEDIEH

اطلاعات دوره: 
  • سال: 

    2014
  • دوره: 

    7
  • شماره: 

    1
  • صفحات: 

    57-66
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    346
  • دانلود: 

    0
چکیده: 

Identifying clusters or Clustering is an important aspect of data analysis. It is the task of grouping a set of objects in such a way those objects in the same group/cluster are more similar in some sense or another. It is a main task of exploratory data mining, and a common technique for statistical data analysis This paper proposed an improved version of K-Means algorithm, namely Persistent K-Means, which alters the convergence method of K-Means algorithm to provide more accurate Clustering results than the K-means algorithm and its variants by increasing the clusters’ coherence. Persistent K-Means uses an iterative approach to discover the best result for consecutive iterations of KMeans algorithm.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 346

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
اطلاعات دوره: 
  • سال: 

    1401
  • دوره: 

    52
  • شماره: 

    3
  • صفحات: 

    205-215
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    136
  • دانلود: 

    23
چکیده: 

Distance-based Clustering methods categorize samples by optimizing a global criterion, finding ellipsoid clusters with roughly equal sizes. In contrast, density-based Clustering techniques form clusters with arbitrary shapes and sizes by optimizing a local criterion. Most of these methods have several hyper-parameters, and their performance is highly dependent on the hyper-parameter setup. Recently, a Gaussian Density Distance (GDD) approach was proposed to optimize local criteria in terms of distance and density properties of samples. GDD can find clusters with different shapes and sizes without any free parameters. However, it may fail to discover the appropriate clusters due to the interfering of clustered samples in estimating the density and distance properties of remaining unclustered samples. Here, we introduce Adaptive GDD (AGDD), which eliminates the inappropriate effect of clustered samples by adaptively updating the parameters during Clustering. It is Stable and can identify clusters with various shapes, sizes, and densities without adding extra parameters. The distance metrics calculating the dissimilarity between samples can affect the Clustering performance. The effect of different distance measurements is also analyzed on the method. The experimental results conducted on several well-known datasets show the effectiveness of the proposed AGDD method compared to the other well-known Clustering methods.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 136

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 23 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
اطلاعات دوره: 
  • سال: 

    1403
  • دوره: 

    18
  • شماره: 

    1
  • صفحات: 

    193-212
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    19
  • دانلود: 

    0
چکیده: 

خوشه بندی مبتنی بر مدل پرکاربردترین روش خوشه بندی آماری است، که در آن داده های ناهمگن با استفاده از استنباط بر اساس مدل های آمیخته به گروه هایی همگن تقسیم می شوند. وجود خطای اندازه گیری در داده ها می تواند کیفیت خوشه بندی را کاهش و به عنوان مثال، موجب بیش برازشی و تولید خوشه های جعلی شود. برای رفع این مشکل، خوشه بندی مبتنی بر مدل با فرض توزیع نرمال برای خطای اندازه گیری معرفی شده است. با وجود این، مقدارهای خیلی بزرگ یا خیلی کوچک (دورافتاده) از خطاهای اندازه گیری باعث عملکرد ضعیف روش های خوشه بندی موجود می شوند. برای رفع این مشکل و ساختن یک مدل استوار نسبت به حضور خطاهای اندازه گیری دورافتاده در داده ها، در این مقاله برای خطای اندازه گیری توزیع آلفا-پایدار متقارن جایگزین توزیع نرمال می شود و با استفاده از الگوریتم EM و روش های عددی، پارامترهای مدل برآورد می شوند. با استفاده از شبیه سازی و تحلیل داده واقعی به مقایسه مدل جدید ارائه شده با روش خوشه بندی مبتنی بر مدل با روش MCLUST، در حالت های با و بدون خطای اندازه گیری پرداخته و کارایی مدل پیشنهادی برای خوشه بندی داده ها در حضور انواع خطاهای اندازه گیری دورافتاده، نشان داده می شود.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 19

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources
اطلاعات دوره: 
  • سال: 

    1402
  • دوره: 

    13
  • شماره: 

    1 ( پیاپی 49)
  • صفحات: 

    41-78
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    58
  • دانلود: 

    17
چکیده: 

اینترنت وسایل­ نقلیه، چارچوب جدیدی برای سیستم­ های حمل ونقل هوشمند است که یکی از اهداف آن بهبود ایمنی و افزایش کیفیت سفرهای جاده ­ای است. تغییرات توپولوژی در اینترنت وسایل­ نقلیه، کارکرد برنامه­ های ایمنی را با چالش ­های اساسی روبه ­رو می ­کند. به علت تنوع شرایط ترافیکی، قابلیت اطمینان روش­ های خوشه­ بندی فعلی با ریسک ­های زیادی مواجه می­ شود. در این پژوهش با هدف افزایش قابلیت اطمینان در اینترنت وسایل ­نقلیه، یک مدل خوشه ­بندی چند­معیاره و بدون وابستگی به زیرساخت به نام RFCV پیشنهاد شده است و با معرفی چهار معیار جدید با عنوان «سابقه تحرک خودرو»، «تطابق سرعت خودرو با میانگین هارمونیک سرعت خودروهای نزدیک»، «تعداد همسایگان مطمئن خودرو» و «کیفیت عملکرد در خوشه­ های قبلی»، خودروهای در حال حرکت وزن­ دهی می ­شوند و یکی از آن ها با بهترین وزن به عنوان سرخوشه انتخاب می­ شود و یک سرخوشه جایگزین نیز برای بهبود پایداری خوشه تعیین می­ شود. پایداری خوشه باعث می­ شود تبادل پیام در نزدیک ترین زمان نسبت به زمان واقعی میسر ­شود. کارایی طرح پیشنهادی از نظر تئوری اثبات شده است و شبیه­ سازی با سناریوهای متعدد در محیط SUMO و NS3، نمایانگر برتری روش RFCV در افزایش «طول عمر مسیر و نرخ تحویل بسته ­ها» و کاهش «میانگین تأخیر و سربار کنترلی» در محیط ­های متراکم شهری و کم­ تراکم بزرگ راهی است.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 58

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 17 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
اطلاعات دوره: 
  • سال: 

    1395
  • دوره: 

    9
تعامل: 
  • بازدید: 

    451
  • دانلود: 

    167
چکیده: 

لطفا برای مشاهده چکیده به متن کامل (PDF) مراجعه فرمایید.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 451

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 167
نویسنده: 

Hashempour Sadeghian Armindokht | NEZAMABADI POUR HOSSEIN

اطلاعات دوره: 
  • سال: 

    2015
  • دوره: 

    1
تعامل: 
  • بازدید: 

    167
  • دانلود: 

    0
چکیده: 

TEXT MINING IS A FIELD THAT IS CONSIDERED AS AN EXTENSION OF DATA MINING IN GENERAL, ALSO KNOWN AS KNOWLEDGE DISCOVERY IN DATABASES. IN THE CONTEXT OF TEXT MINING, DOCUMENT Clustering IS AN UNSUPERVISED LEARNING METHOD FOR AUTOMATICALLY SEGREGATING SIMILAR DOCUMENTS OF A CORPUS INTO THE SAME GROUP, CALLED CLUSTER, AND DISSIMILAR DOCUMENTS TO DIFFERENT GROUPS. WHILE HUNDREDS OF Clustering ALGORITHMS EXIST, IT IS DIFFICULT TO FIND A SINGLE Clustering ALGORITHM THAT CAN HANDLE ALL TYPES OF CLUSTER SHAPES AND SIZES, OR EVEN DECIDE WHICH ALGORITHM WOULD BE THE BEST ONE FOR A PARTICULAR DATA SET. EACH ALGORITHM HAS ITS OWN APPROACH FOR ESTIMATING THE NUMBER OF CLUSTERS, IMPOSING A STRUCTURE ON THE DATA, AND VALIDATING THE RESULTING CLUSTERS. THE IDEA OF COMBINING DIFFERENT Clustering EMERGED AS AN APPROACH TO OVERCOME THE WEAKNESS OF SINGLE ALGORITHMS AND FURTHER IMPROVE THEIR PERFORMANCES. ON THE OTHER HAND, INSPIRED BY THE GRAVITATIONAL LAW, DIFFERENT Clustering ALGORITHMS HAVE BEEN INTRODUCED THAT EACH ONE ATTEMPTED TO CLUSTER COMPLEX DATASETS. GRAVITATIONAL ENSEMBLE Clustering (GEC) IS AN ENSEMBLE METHOD THAT EMPLOYS BOTH THE CONCEPTS OF GRAVITATIONAL Clustering AND ENSEMBLE Clustering TO REACH A BETTER Clustering RESULT. THIS PAPER REPRESENTS AN APPLICATION OF GEC TO THE PROBLEM OF DOCUMENT Clustering. THE PROPOSED METHOD USES A MODIFICATION OF THE ORIGINAL GEC ALGORITHM. THIS MODIFICATION TRIES TO PRODUCE A MORE VARIED Clustering ENSEMBLE USING NEW PARAMETER SETTING. COMPUTATIONAL EXPERIMENTS WERE CONDUCTED TO TEST THE PERFORMANCE OF THE GEC APPROACH USING DOCUMENT DATASETS. PROMISING RESULTS OF THE PRESENTED METHOD WERE OBTAINED IN COMPARISON WITH COMPETING ALGORITHMS. ...

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 167

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0
مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources
اطلاعات دوره: 
  • سال: 

    1401
  • دوره: 

    7
  • شماره: 

    2
  • صفحات: 

    1-22
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    156
  • دانلود: 

    15
چکیده: 

Purpose: Clustering and co-word analysis is a method to reveal relationships and links and illustrate the intellectual structure of a scientific field. This research tries to study the intellectual structure of articles in the field of futures studies in Iran by using the technique of co-word analysis. Method: The current research is a descriptive-analytical development with a scientometric approach. The statistical population is 921 articles retrieved records in the field of futures studies. Findings: The findings showed that articles in the field of futures studies in Iran are often associated with positive growth, and in terms of frequency, the keywords scenario, Islamic Republic, and foresight are the most frequent in futures studies. The findings related to the hierarchical Clustering led to the formation of 8 clusters in this field, namely "ICT visions", "geographers who love the future", "knowledge development", " Futuristic higher education", "Future of Religion", "Regional Relations", "Strategic Foresight" and "Heavy Weight of Method". Conclusion: According to the findings of the current research and the high frequency of the keyword scenario, as well as the density and relationships of this keyword with other keywords, it can be concluded that the scenario is the dominant approach in futures studies. Also, according to the resulting clusters, it was observed that these researches have a high variety, but addressing the future in many areas is still neglected.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 156

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 15 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
اطلاعات دوره: 
  • سال: 

    1401
  • دوره: 

    52
  • شماره: 

    4
  • صفحات: 

    281-291
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    155
  • دانلود: 

    18
چکیده: 

Automatic topic detection seems unavoidable in social media analysis due to big text data which their users generate. Clustering-based methods are one of the most important and up-to-date categories in topic detection. The goal of this research is to have a wide study on this category. Therefore, this paper aims to study the main components of Clustering-based-topic-detection, which are embedding methods, distance metrics, and Clustering algorithms. Transfer learning and consequently pretrained language models and word embeddings have been considered in recent years. Regarding the importance of embedding methods, the efficiency of five new embedding methods, from earlier to recent ones, are compared in this paper. To conduct our study, two commonly used distance metrics, in addition to five important Clustering algorithms in the field of topic detection, are implemented by the authors. As COVID-19 has turned into a hot trending topic on social networks in recent years, a dataset including one-month tweets collected with COVID-19-related hashtags is used for this study. More than 7500 experiments are performed to determine tunable parameters. Then all combinations of embedding methods, distance metrics and Clustering algorithms (50 combinations) are evaluated using Silhouette metric. Results show that T5 strongly outperforms other embedding methods, cosine distance is weakly better than other distance metrics, and DBSCAN is superior to other Clustering algorithms.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 155

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 18 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
نویسندگان: 

اطلاعات دوره: 
  • سال: 

    2021
  • دوره: 

    104
  • شماره: 

    -
  • صفحات: 

    0-0
تعامل: 
  • استنادات: 

    1
  • بازدید: 

    58
  • دانلود: 

    0
کلیدواژه: 
چکیده: 

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 58

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 1 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
نشریه: 

رادار

اطلاعات دوره: 
  • سال: 

    1394
  • دوره: 

    3
  • شماره: 

    4 (پیاپی 10)
  • صفحات: 

    53-63
تعامل: 
  • استنادات: 

    0
  • بازدید: 

    951
  • دانلود: 

    235
چکیده: 

در این مقاله آشکارساز هدف متحرک در رادار مایمو با آنتن گسترده در حضور کلاتر a-Stable پیشنهاد شده است. به دلیل پیچیدگی محاسبه تخمین پارامترهای نامعلوم در حالت وجود هدف، از آزمون رائو برای استخراج آشکارساز استفاده می شود. مدل a-Stable یک مدل عام بوده که می توان با انتخاب مناسب پارامترهای آن به محیط های مختلفی اعمال کرد. مشکل این مدل این است که فرم بسته ای برای تابع چگالی احتمال آن وجود ندارد. خوشبختانه مدل های تقریبی وجود دارد که این توزیع را به صورت فرم بسته بیان می کند. در این مقاله به دلیل انطباق خوب مدل ترکیبی گوسی _کوشی با داده های تجربی، از این مدل برای بیان کلاتر a-Stable استفاده می شود. در نهایت براساس نمودار احتمال آشکارسازی بر حسب نسبت سیگنال به کلاتر، عملکرد آشکارساز پیشنهادی با آشکارساز بهینه گوسی مقایسه می گردد. نتایج حاصل از شبیه سازی نشان می دهد که عملکرد آشکارساز پیشنهادی، به مراتب بهتر از آشکارساز بهینه گوسی است.

شاخص‌های تعامل:   مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resources

بازدید 951

مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesدانلود 235 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesاستناد 0 مرکز اطلاعات علمی Scientific Information Database (SID) - Trusted Source for Research and Academic Resourcesمرجع 0
litScript
telegram sharing button
whatsapp sharing button
linkedin sharing button
twitter sharing button
email sharing button
email sharing button
email sharing button
sharethis sharing button